电子行业为什么需要系统级测试?
在半导体晶体管尺寸不断缩小、芯片功能日益复杂的趋势下,测试已成为产品落地生产前的关键一环。而伴随着更严格的可接受质量水平(AQL)认证推出,测试的方法也在不断推陈出新。其中,系统级测试(简称SLT)就是其中一种重要方法。
事实上,现在备受工程师关注的、能够解决很多测试问题的系统级测试并不是现在才出现的技术,至少在计算领域,它从90年代末就开始在使用。如今,随着芯片所集成的晶体管数量呈指数级增长,芯片的复杂程度也日渐提升。在这种情况下,更多IC制造厂商采用SLT来提升芯片系统的良品率与质量水平。
01 系统级测试有什么独到之处?
什么是SLT,它为什么与众不同?能够解决什么问题?
SLT亦称为功能测试,是在模拟终端使用场景中对待测芯片(DUT)进行测试的一种方法,通过运行操作系统和使用待测芯片执行通用或目标应用测试,无需像传统自动测试设备(ATE)那样创建测试向量。SLT仍需要编写测试,但编写方式不同。
那么,SLT有哪些独到之处和优势呢?
过去20年中,整个SLT市场有相当大的增长。手机和平板电脑中移动处理器的复杂性、关键性任务的增加,以及产品上市时间竞争都是推动其增长的主要原因。
SLT之所以使用日渐普遍,是因为芯片行业的许多趋势正在推动其普及。
首先是质量要求日益提高,过去10年,人们更加依赖手机等电子设备,芯片的高质量要求促使制造商对其芯片和系统进行全面测试,以减少终端用户购买产品后遇到问题的可能性。为此,移动领域的SLT正在进入快速增长模式。
汽车领域的趋势尤为明显,在辅助自动驾驶汽车中,利用电子设备或软件感知事件,并通过自动转向或制动对事件做出反应。ADAS(高级驾驶辅助系统 )的关键任务要求更高的标准,这意味着在应用中运行的超高功率器件、混合信号器件性能、平台效率和热稳定性至关重要。
从市场竞争角度来看,芯片供应商不断将技术推向极限,以提高性能、电池续航和良率,这意味着他们需要做好以下事情:
·尽早交付新工艺节点的产品,尽管工艺缺陷率可能比较高.
·尽可能以低电压运行,以延长电池续航时间.
·微调PLL设置使良率最大化.
·采用更前沿的封装技术来提高晶体管密度和性能。
另外,在汽车的信息娱乐部分,汽车公司比以往任何时候都更接近技术的前沿,采用尖端技术实现更高的稳定性将有助于缩短汽车信息娱乐产品的上市时间。
未来,SLT的下一个增长领域是大数据处理和边缘/云AI(人工智能)应用,它将有可能超过计算领域。
鉴于上述需求,必须通过大量测试来确保成品中使用的是优质元器件。随着技术不断推向极限,使用SLT有助于防止故障漏检,确保元器件达到所需的高质量水平。此外,在提高产品质量的同时,在尽可能靠近终端应用的地方运行设备,也有助于缩短产品上市时间。
02 传统测试覆盖率变得更具有挑战性
IC制造商正在将更多的功能压缩到给定芯片中,既有自研,又有第三方设计。以移动处理器为例,早期几乎没有很多功能,只支持通话。今天,其功能已涵盖图形、图像处理、高级安全等;过去的通信是数字处理,现在采用语音和生物特征数据处理,甚至包含专用神经网络等AI算法处理,AP需要与高速内存集成。
除了移动设备,处理器还可以做很多重要的事情,如健康功能、记录和存储、连接和控制、与汽车周围的传感器通信、确保安全、通过机器学习人工智能简化人们的生活。与这些功能块交互相关的故障可能特别难以捕捉,尤其是当其中的测试接口使用不同语言时。
所有这些新功能被压缩到一个AP中,也使晶体管数量持续增长,并超越了摩尔定律。不过,随着行业持续创新,人们预测的摩尔定律的极限似乎还没有到来。
当然,测试挑战不仅仅是功能,当我们将成倍增长的晶体管挤进IC时,有时需要做出权衡,可能导致开始侵蚀通过传统方法实现的测试覆盖率。过去几年的实践证明,随着晶体管数量的增加,测试量正在大幅增长。而让ATE以与晶体管数相同的指数速度增长是很难实现的。
因此,随着复杂性的增加,出现缺陷的几率更高,需要更多的测试,以避免缺陷率不断增加。SLT可以帮助我们解决这些问题。
03 如何运行SLT?
SLT是以与最终用途紧密匹配的方式对产品进行的功能测试,其 “系统” 部分在定制的系统级测试板上实现。
SLT的测试流程包括:
第一是执行特定操作,运行一些系统中固有的器件通用功能和目标应用程序(如启动芯片或加载操作系统),或运行某些模块编写的特定程序(如性能评估程序),并验证是否都能按预期工作。使用的“系统级测试板” 类似于提供给客户的“参考设计”或评估板。
第二是判断该操作是否成功,依据测试的结果或该操作的成功/失败进行衡量。例如,在验证某个内部进程是否成功执行时,可以用操作系统能否成功启动,或是检查某个测量值(性能测试结果与阀值的比较)作为判断的依据。
大多数情况下,SLT中的系统都配备一些板载处理器来执行测试流程。由于片上系统(SoC)和系统级封装(SiP)芯片是SLT的主要测试对象,因此测试用处理器通常就是待测芯片的一部分。如果不是此种情况,待测芯片的外围测试系统通常要配备一个合适的处理器。
被测器件周围的SLTB电路可以根据需求的变化而变化;还可以快速、轻松地在屏幕上显示最终客户报告的故障逃逸。而要在ATE上实现这一点,必须进行大量的故障分析,将功能故障追溯到晶体管级别,以查看是否有能力捕获它。另一方面,SLT可以采用激发故障的确切用例,并快速将此功能测试添加到SLT测试中,几乎可以立即停止渗流(bleeding),同时返回并挖掘出故障逃逸的根本原因。
不过,由于SLT是模拟真实终端使用场景的功能测试,而不是ATE中的结构测试,SLT的测试时间通常比传统ATE长得多。因此,并行测试效率的概念对于保持SLT的成本效益变得更加重要。ATE测试时间以10秒为单位,SLT则以分钟或10分钟为单位。可以想象,要想达到最高效率,就需要在每个系统中增加一个数量级的并测工位。
由于测试时间较长,与传统ATE测试相比,SLT测试设备具有更高的工位密度和更低的工位成本。
04 归根结底还是成本
为什么SLT是一个好的解决方案,归根结底是成本。在SLT总体测试策略中,人们总是希望尽早捕获,以避免下游的工艺成本。ATE晶圆测试在流程早期捕获故障方面表现出色,包括:晶体管级问题、对变化频率/电压级的敏感性、遵守基本设计规范等。
有些故障是在封装过程产生的,将运行ATE终测来筛选这些问题。然而,仍然有一些故障非常微妙和复杂,以至于因为一个小的DPPM级别无法通过测试验收流程。
对于高常规质量级别要求,ATE成本通常会随着测试时间的延长而增加。这种增加在总体上是可控的,且在一定程度上是线性的。但在非常高的复杂度/晶体管数下,要提供相同的质量水平,ATE成本最终会达到曲线的拐点,开始呈指数增长。
这主要是因为发现这些故障需要花费大量时间,而且还需要用跟周边器件一起测试,其中一些是在今天的ATE上完成的,包括一些级别的参数测试和功能测试。然而,在某些情况下,额外电路数量和测试的长度会导致该策略崩溃。有趣的一点是,SLT成本/测试时间并没有随着复杂性的增加而增加,因为它只是启动一个正在运行的应用程序。这就是说,对于捕捉晶体管级设计参数故障,它不是一种非常经济有效的方法。在过去50年的历史中,ATE非常擅长捕捉这些故障。
为什么ATE中捕获的许多故障类在SLT中会捕获不到?这是因为,与ATE不同,SLT并没有系统地测试每一个晶体管及其参数,而只是在器件内测试真实世界应用的一个子集,并查看功能结果。而运行每一个可以想象的应用程序来激发每一个晶体管并产生故障几乎是不可能的。
SLT的经济有效在于发现合理百分比的故障,这些故障是由于ATE无法测试的区域或同时刺激芯片及其外围的多个IP模块造成的。
单个SLT系统的成本可能与ATE系统相似,或略高于ATE系统,但并测性(一次测试的器件数量)要高得多,因此每个器件的成本可能约为ATE的1/4或以下。
因为有这么多芯片同时并行测试,所以每个芯片的SLT测试成本低于ATE。它也是一个很好的环境,可以用真实世界的芯片应用场景运行在ATE上不可能实现的测试。
在复杂度继续呈指数增长且任务关键型应用数量不断增长的情况下,将ATE和SLT策略结合起来是维持极高质量水平和最低成本的理想解决方案。
从以下几个图中可以看到有关成本的几个方面:在某种程度上,ATE成本与复杂性/晶体管数呈线性关系;SLT不是捕捉“典型”ATE故障的经济有效的方法;SLT在筛选出测试流程结束时最后几个难以发现的故障方面非常经济有效;因此,对于具有非常高质量需求的应用,将SLT添加到现有ATE测试流程后通常是最具成本效益的总体测试策略。
05 为什么是Teradyne?
需要指出的是:在部署SLT时,并不总是要孤注一掷。许多公司在是否进行SLT测试以及用SLT测试其产品的百分比方面采用了不同的理念。这是一种综合考虑多种因素,平衡成本的行为,每个公司/应用的理念通常略有不同。
Teradyne的SLT 测试机的优势之一是真正的并测,每个芯片完全独立于其相邻芯片,这是执行SLT与批处理的更有效的方法。
另外,在Teradyne的存储测试业务部中有一个专门的技术团队,十多年来他们成功设计制造超大规模自动化生产平台。作为半导体测试领域的全球领导者,Teradyne将存储自动化架构和专业知识与半导体测试知识相结合,利用其Titan平台将差异化的SLT自动化和测试解决方案推向市场,帮助用户解决测试方面的难题。
SLT是ATE测试设备触达市场的补充测试步骤和扩展,Teradyne提供支持整个测试生命周期的解决方案,有助于以最优的时间实现最大的测试覆盖率和最高的质量。
06 结语
SLT已存在了将近30年,主要用于尖端大型数字计算应用,它是在系统级测试板上使用专用外围设备对芯片进行的应用场景测试,用来捕获最后0.00xx%的故障,并实现最低可能的逃错率。
SLT的增长源于对质量的需求不断增加,以及关键任务电子应用场景的迅速增长、芯片器件的复杂性迅速增加,以及上市时间窗口的不断缩小,特别是某些故障类别仅能在真实应用场景下显现。
Teradyne充分利用半导体ATE业务的技术,提供SLT差异化量产异步自动化平台,服务于广大手机应用处理器客户,展现了市场的领先地位,并向汽车和HPC领域不断推进。